其他
科研 | Cell Reports:拷贝数变异驱动激酶重组,导致癌细胞的遗传易感性
编译:微科盟陌陌谦行,编辑:微科盟Tracy、江舜尧。
微科盟原创微文,欢迎转发转载。
体细胞DNA拷贝数变异(CNV)在癌症中很普遍,尽管在改变细胞信号状态方面通常没有明显的特征,但可以驱动癌症的进展。在这里,我们整合了5598个肿瘤样品的基因组和蛋白质组数据,以识别导致异常信号转导的CNV。对数据结果进行关联分析,我们概括了已知的激酶与底物的关系,并且对有因果关系的基因进行进一步的系统分析。在全肿瘤分析中我们确定了303个重要关联基因,其中43%的基因在癌细胞系中复制,包括在多种肿瘤类型中被发现的44个磷酸化位点关联基因。我们预测的多个Hippo信号调节基因也在实验中得到证实。通过RNAi、CRISPR和药物筛选获得的数据,我们发现了癌细胞系中激酶成瘾的证据,从而确定了针对激酶依赖型细胞系的抑制剂。我们认为,基因的拷贝数可作为激酶抑制影响差异的预测指标,该策略在未来可能用于抗癌治疗。
论文ID
原名:Copy number aberrations drive kinase rewiring, leading to genetic vulnerabilities in cancer译名:拷贝数变异驱动激酶重组,导致癌细胞的遗传脆弱性
期刊:Cell Reports
IF:8.109发表时间:2021.05通讯作者:Pedro Beltrao,Martin L Miller
通讯作者单位:欧洲分子生物学实验室,剑桥大学
实验设计
实验结果
针对与肿瘤磷酸化水平变化相关的拷贝数变化,我们已经开发了一种计算方法,以鉴定患者来源的癌症样本中驱动磷酸化信号转导发生变化的因果基因(图1A)。我们建立了遗传关联模型,使用CNV作为信号转导的预测因子,预测从肿瘤RPPA蛋白芯片数据中心(TCPA)获得的肿瘤样品中的磷酸化水平改变。RPPA测得的磷酸化水平变化可能是由于总蛋白质的变化或磷酸化化学计量的变化引起的。为了关注化学计量的变化,我们将分析范围限制在RPPA数据库中具有相匹配的蛋白质丰度数据的37个磷酸位点,并进行标准化(STAR方法)。在排除CNV在转录后减少的基因之后,我们获得了15524个编码蛋白质基因的CNV和基因表达水平。然后我们将CNV与来自17种肿瘤类型的5,598个肿瘤样本中37个磷酸位点的磷酸位点水平相关联,并将总蛋白丰度和肿瘤类型作为协变量考虑在内(STAR方法)。因为拷贝数畸变覆盖了较大的染色体区域,所以磷酸化位点磷酸化水平的变化将显示与共扩增区域中多个基因的CNV关联,但其中许多可能是虚假的。例如,图1B显示了与Akt1磷酸化水平变化相关的基因。平均而言,每个磷酸位点预计与419个基因相关(错误发现率false discovery rate 为10%,效应大小effect size> 0.05)。排除由于共扩增而导致虚假的关联之前,我们测试了CNV-磷酸位点的关联是否可以验证激酶-底物关系。为此,我们分析了PhosphositePlus数据库中确定的118种已知的激酶-底物关系,以及涉及的37个磷酸位点。总体而言,通过CNV和表达水平分析(图1C),我们观察到,已知的激酶-磷酸化位点对通常比随机预期(p <0.01)具有更显著的关联。例如,在YAP总蛋白水平降低之后,YAP pS127的磷酸化与LATS2激酶的表达和拷贝数变化显示出显著的相关性。同样,PRKD1、PDPK1和MAP3K5的表达与AktT308、Akt pS473、p38 pT180、p38Y182等位点的磷酸化水平正相关(p <0.01;图1D)。考虑到拷贝数改变会影响改变区域内的多个基因,因此许多先前定义的关联很可能是虚假的关联。因而,我们需要进一步确定每个区域中调控下游激酶信号传导的最可能的基因。首先,我们选择了CNV关联基因,这些基因的表达与磷酸酶活性相关(FDR <5%)。然后,我们根据以下3种分析方法的联合评估,在每个染色体区域内选择了排名最高的相关基因。这三种方式是:(1)CNV;(2)基因表达关联效应大小;(3)功能区互动网络中的基因-磷酸化蛋白距离(STAR方法)。在图1B中,我们在全基因组范围内寻找调节AKT1 pT308磷酸化水平的相关基因,并在每个片段中鉴定选定的相关基因。我们发现了PTEN调节因子以及其它候选调节因子。通过这种方法,每个磷酸位点平均获得8个因果基因,每个因果基因来自一个基因组片段。除PEA15 pS116以外的所有磷酸化位点均具有至少一个基因作为预测的调节因子。12个磷酸位点,包括Chk1 pS345、Chk2 pT68、Akt pT308、AktpS473、MAPKpT202、MAPKpY204和YAP pS127,被预测会受到多于10个因果基因的调控。在全肿瘤数据中,我们获得了因果基因和受调控的磷酸化位点之间的303个关联。在考虑了其它协变量(年龄、性别和种族)之后,所有303个关联在磷酸化位点表达和磷酸化位点CNV线性模型中仍然保持显著性。这些关联基因由264个因果基因组成,其中11%(29/264)与多个磷酸化位点相关联。这些基因参与细胞周期、TOR信号传导、蛋白激酶活性调节以及对DNA损伤刺激反应的正向调节(Fisher adjusted p <0.01;图1E)。这些因果基因也包括多种激酶(19/264,Fisher adjusted p <0.01,包括FLT1,PTK6和YES1)和磷酸酶(11/264,Fisher adjusted p <0.01,包括PPA2和PPP1CC)。与它们的广谱活性一致,我们发现,与其它基因类型相比,磷酸酶与多个磷酸位点相关(Wilcoxon rank-sum p <0.05)。例如,PPP1R3B被预测可以调节多个磷酸化位点,包括p90RSK、Tuberin和FOXO3。同样,据预测,PTEN可同时调节Akt磷酸位点(S473和T308)和GSK3AB磷酸化位点(pS21,9)。我们还从预测的病因基因列表中发现了COSMIC(癌症体细胞突变目录)数据库中已知癌症驱动基因的大量富集,例如CDK4、EGFR、PTK6和CCND1(29/264;Fisher adjusted p <0.01)。已知某些蛋白质错义突变会导致激酶信号传导发生变化。从至少50个癌症患者样本中的1,002个具有错义突变的基因中,我们发现了重复突变的基因与磷酸化水平之间的24个关联对。这些关联对中包括了EGFR突变与EGFR pY1068和HER2pY1248磷酸化水平之间的正相关。同样,NRAS基因的错义突变与MAPK pT202、Y204磷酸化水平正相关,而KRAS基因的突变与MEK1 pS217、S221磷酸化水平正相关。在一些情况下,拷贝数变化可能与错义突变同时发生,并且我们难以区分下游信号传导变化是否与拷贝数变化或点突变相关。因此,为确保拷贝数变化和磷酸化位点之间的303个关联均不依赖于点突变,我们反复测试了每个重复突变的基因作为CNV-磷酸化位点线性模型中协变量的影响。尽管在某些情况下,CNV-磷酸化关联的重要性降低了,但仅在6个案例中,CNV并不是磷酸化水平的预测因子。例如,PDPK1 CNV与mTOR pS2448水平之间的关联可以用IL7R中的错义突变来解释;同样,ZMYM1 CNV与EGFR pY1068之间的关联可以用EGFR突变来解释。
A,基因(CNV/表达)-磷酸位点磷酸化关联方法的关键步骤。红色表示正相关的强度,蓝色表示负相关的强度。示意图网络表示STRING(检索相互作用基因/蛋白质的搜索工具)数据库中的蛋白质-蛋白质相互作用,其中节点为蛋白质或基因,边缘为相互作用。边缘厚度指示网络中相互作用的强度。我们从网络中CNV(基因)节点和磷酸位点(基因)节点之间的距离以及分隔这些节点的交互权重得出基于网络的评分,用于对关联进行排名。B,Manhattan plot图显示基因拷贝数变化与Akt磷酸化水平(Akt pT308)之间的全基因组关联。红色虚线表示重要的基于拷贝数的关联(FDR为10%)。以棕色突出显示的基因表示基于基因表达的关联。蓝色突出显示的基因是每个基因组区域内排名最高的基因。C,对于已知的激酶-底物相互作用(彩色)或任何基因-磷酸化位点对(灰色),CNV(紫色)或mRNA(黄色)水平与磷酸化水平改变之间的相关性意义。正/负号指示关联的方向性。D,在排除蛋白质表达水平因素后,对RPPA磷酸化水平和TCGA / TCPA全癌症数据(已知调节因子与底物之间关系)中调节因子的mRNA水平进行关联统计分析。E,预测调节因子的基因本体过表达分析。 2.癌细胞系中被预测介导信号传导变化的调控因子的验证
为了检验全肿瘤分析中预测关联的可靠性,我们尝试重复CCLE(癌细胞系百科全书)中癌细胞系中的重要关联。这些细胞具有公开发布的拷贝数、表达、和磷酸化信息。我们在两个独立的RPPA数据库(来自DepMap和MCLP),以测试这些关联在癌细胞系中的可复制性。在DepMap(10%FDR)中的890个癌细胞系中,我们总共重复了303个预测的因果基因-磷酸位点关联中的130个;另外,我们通过检测所预测的致病基因的mRNA水平,将MCLP癌细胞系数量缩小至319个(10%FDR),其中,303个预测的致病基因-磷酸化位点中的66个得到重复。预测的差异性可能部分是由样品大小的差异或肿瘤与细胞系样品的异质性差异(例如非肿瘤细胞的存在或体外培养过程中的变化)引起的。为了评估单个磷酸化位点的总体预测能力,我们测试了磷酸化水平的模型,将其作为预测因果基因表达谱的线性组合方法(STAR方法)。DepMap细胞系中,37个磷酸化位点中有8个磷酸化位点的磷酸化水平至少有20%的变化可由预测的致病基因在细胞系中的表达水平解释。对于磷酸化位点MEK1 pS217、S221,我们可使用基于TCGA肿瘤数据库的线性模型来预测DepMap细胞系中此位点至少20%的变化。MCLP细胞系的37个磷酸化位点中,12个磷酸化位点的至少20%的磷酸化水平变化,可以通过预测因果基因的表达来解释(图2A)。对于其中的三个磷酸化位点,HER3 pY1289、EGFR pY1068和YAP pS127,我们可以使用基于TCGA肿瘤数据库的线性模型来预测它们在MCLP细胞系中的至少20%的变化(图2A)。我们定义了一组更为严格的44个因果基因-磷酸化位点对,它们可在至少20%的肿瘤类型中被重复(4/18),并在两个癌细胞系数据中被验证(图2B)。被复制的关联,包括众所周知的例子(图2B和2C),例如PTEN的丢失与AktpT308和Akt pS473的磷酸化水平升高相关,EGFR扩增与HER2 pY1248磷酸化水平相关。除了这些已知的例子外,我们还能够鉴定出几个潜在的磷酸化水平调节因子,这些调节因子已被报道在癌症的发展或进展中起着关键的作用。例如,据预测,MTDH基因与多种信号通路(包括Akt,Wnt和MAPK)的调控有关,导致肿瘤转移,可正向调节p27 pT198(细胞周期蛋白-依赖性激酶抑制子)水平。
A,基于假定的因果基因表达线性模型预测的每个磷酸化位点的磷酸化水平变化。使用TCGA(暗)、DepMap(亮)和MCLP(亮)数据库中的RPPA衍生线性模型来预测基于蛋白表达的细胞系中磷酸化位点的磷酸化水平,并与DepMap、MCLP RPPA检测进行关联。B,在全肿瘤分析中被鉴定并在DepMap和MCLP细胞系中被验证的基因-磷酸化位点关联对清单。C,根据磷酸化水平的变化(排除蛋白质水平变化因素后),对某些排名靠前的关联对中预测的调节因子的由mRNA水平或拷贝数水平进行分档。 3.癌细胞中激酶成瘾的证明
在证明拷贝数改变会导致激酶信号改变后,我们接下来试图寻找这种信号差异产生潜在遗传漏洞的案例。先前的研究表明,癌细胞倾向于依赖蛋白质的活性,例如激酶,因此可能对激酶基因的丢失敏感。我们利用Project Achilles最近生成的通过RNAi和CRISPR敲低或敲除蛋白后的癌细胞系,以测试该概念的普遍性。根据文献中的证据,RPPA磷酸化位点可分为激活位点(25个位点)或抑制位点(9个位点)。我们将DepMap数据库中磷酸化水平相关的蛋白质活性与经CRISPR筛选后406个癌细胞系中相应基因缺失的敏感性相关联。与随机对相比,给定细胞系中磷酸化水平的升高总体上显示了基因在各个细胞系中的重要性(Wilcoxon rank-sum p <0.05;图3A)。激活位点总体呈负相关趋势,而抑制位点总体呈正相关趋势(图3B)。但是,蛋白质活性依赖性仅对一部分受调节的蛋白质有意义(图3B)。这些依赖性随基因而变化,我们通过分析RNAi数据和RPPA磷酸化蛋白质组学检测结果,概括了几种蛋白质的依赖性(图3B)。我们观察到YB1、AKT、Her2、ER alpha和MEK具有最强的复制活性依赖性,这种依赖性在至少一个实验体系(即CRISPR和RNAi)中被观察到。我们用来自MCLP数据库的RPPA数据重复了RNAi / CRISPR筛选与RPPA数据之间的关联分析,同样观察到磷酸化水平与细胞对磷酸化基因丢失的敏感性相关,尽管我们在不同的磷酸化位点观察到了更强的关联,例如YAP pS127。该分析证实,平均而言,癌细胞系显示出对激酶和其他蛋白质活性的依赖性增加,并且对激酶及其他蛋白的抑制更为敏感。接下来,我们分析了药物反应数据库,以探究磷酸化水平与药物之间的关系。根据癌症药物敏感性基因组学(GDSC)数据库,我们将37种磷酸化Ab测得的磷酸化水平与746种癌细胞系对265种药物的敏感性谱进行了关联,其中30种磷酸化位点磷酸化水平显示出与至少一种药物靶标的敏感性相关(FDR <5%)。这些磷酸化位点的很大一部分(18/30)与细胞对超过25种药物的敏感性有关。例如,MEK1 pS217、S221水平高的癌细胞系对大多数RAF / MEK / ERK抑制剂(如refametinib,SB590885)更敏感。同样,YAP pS127水平与甲氨蝶呤(methotrexate)抑制相关。我们对这些关联进行了完善,以鉴定870例药物敏感性与在RNAi或CRISPR筛选中对激酶/磷酸化基因丢失的敏感性之间的相关性(图3C)。在这些案例中的31个个例,在经基因敲除和敲降方法分析后,结果均一致。例如,高EGFR磷酸化水平可预测对EGFR抑制剂(pelitinib和afatinib)敏感的细胞系,对CRISPR和RNAi处理后的EGFR基因丢失也很敏感。同样,对ERBB2抑制剂(CP724714)敏感的细胞系与HER2 pY1248和HER3 pY1289高磷酸化水平相关,对CRISPR和RNAi后的ERBB2基因丢失也很敏感。我们使用MCLP的RPPA数据验证了磷酸水平与药物反应之间的许多相关性。
A,磷酸化水平与基因必需性(CRISPR)之间关联的显著性(-log 10(p值))的分布。B,采用RNAi和CRISPR筛选,每个磷酸化位点的磷酸化水平和基因必需性之间的关联意义(-log 10(p值))。C,磷酸化水平与药物敏感性(1%FDR)之间的关联。红色和蓝色分别表示与RNAi-药物反应中的正相关和负相关。星号(*)表示CRISPR-药物关联实验支持的关联。在该图中,仅显示与磷酸化位点具显著关联并且能被CRISPR和RNAi筛选验证(至少一种方法)的药物。 4.CNV是激酶相关遗传易感性的预测因子
我们的结果表明,基因拷贝数的变化可以指示磷酸化位点磷酸化水平的变化,并且癌细胞依赖于这些磷酸化位点的活性。因此,与激酶活性相关的拷贝数变化也能预测激酶的敏感性。确实,我们发现了几个案例,其中CNV预测磷酸化水平差异与下调、敲除或抑制对相应蛋白质的影响相关。例如,ERBB2和EPN3 CNV可以预测EGFR pS1068磷酸化水平,并与对EGFR基因缺失的敏感性以及对包括afatinib和gefitinib在内的EGFR抑制剂敏感性相关(图4A和4B)。
A和B,EGFR pY1068活性水平,对EGFR(以及ERBB2和ERBB3)基因缺失的敏感性(RNAi)以及对相关激酶抑制剂的敏感性。 作为另一个示例,我们更详细地研究了CNV和YAP pS127磷酸化水平之间的关联,确定了12个基因作为潜在的调节因子,其中5个在癌细胞系中得到验证(图5A)。我们使用肿瘤TCGA数据库和两个细胞系的RPPA数据库建立多个线性回归模型,根据基因与YAP磷酸化水平的关联对基因进行了排名(图5B)。组合模型表明,ARHGEF17、EAF1、PFKM和PLA2G16的CNV与YAP pS127磷酸化水平显示了最强的关联性(图5B)。YAP是转录因子,是Hippo信号通路的关键组成部分。YAP在S127处的磷酸化导致YAP在细胞质中的滞留,YAP在S381和S384处的磷酸化与YAP降解有关。因此,S127的磷酸化将导致YAP的转录活性降低。但是,S128处的磷酸化可以阻断14-3-3介导的S127磷酸化-YAP的胞质滞留。为了解释S127 RPPA抗体检测到的转录活性变化,我们研究了45个YAP正调控靶基因的基因表达变化。在对YAP蛋白水平进行标准化之后,我们观察到这些基因的表达水平变化与总YAP、总磷酸化YAP和磷酸化YAP的变化之间呈正相关,这种情况均可在患者肿瘤样本和MCLP细胞系中被检测到,这表明S127的RPPA抗体与YAP活性正相关。与此相符,RPPA YAP S127水平与细胞对敲除/敲降YAP的敏感性之间存在正相关关系。我们通过实验测试了ARHGEF17和PLA2G16基因缺失对YAP pS127磷酸化水平的影响。我们选择了具有不同基线YAP磷酸化水平的细胞系,并确认在MCF7和MDA-MB-361细胞中YAPpS127水平较低,而在MDA-MB-468和T47D细胞中YAP pS127水平较高,这与来自癌细胞系MCLP RPPA蛋白质组学数据结果一致。qRT-PCR实验证实了MDA-MB-468和T47D细胞中,shRNA(慢病毒载体)对ARHGEF17和PLA2G16进行了有效的敲低(图5C)。敲低ARHGEF17蛋白水平会导致两种细胞系中YAP pS127的磷酸化水平出现显著的下降,这与预测一致(p <0.05;图5C和5D)。PLA2G16的缺失对YAP pS127的水平也具有一定的影响,我们在HeLa细胞中进行实验测试,检测ARHGEF17、PFKM和EAF1的过表达时YAP pS127磷酸化水平。LATS2(阳性对照)和ARHGEF17的过表达导致YAP pS127水平的增加,促进YAP蛋白在细胞质中的定位,表明YAP pS127磷酸化(图5E)。相反,PFKM和EAF1的过表达时,YAP pS127水平发生了适度降低,促进YAP蛋白在细胞核中定位,这与基于线性模型的关联一致(图5E)。这些结果表明,通常可以通过模型细胞系中的基因敲除或敲低、蛋白过表达实验来验证所识别的关联。为了进一步剖析ARHGEF17在Hippo信号中的调控作用,我们进行了以靶向ARHGEF17的shRNA处理的MDA-MB-468和T47D细胞及其对照细胞的蛋白质组学、磷酸化蛋白质组学分析。差异磷酸化数据分析显示,在MDA-MB-468和T47D细胞中,ARHGEF17被敲低(5%FDR)后,分别有3,182和259个磷酸化位点发生了显著变化。这些磷酸化位点包括两个细胞系中多个YAP磷酸化位点磷酸化水平的显著降低(图5F)。然后,我们研究了ARHGEF17敲低后的细胞中蛋白质丰度的变化,尤其是Hippo信号通路成分的变化(图5G)。差异蛋白丰度数据分析显示,我们分别在MDA-MB-468和T47D细胞中对ARHGEF17进行敲低(5%FDR)后,1,754和308个蛋白的丰度发生了显著变化,其中包括两种细胞系中ARHGEF17蛋白质水平的预期下降(调整p <0.01)。尽管我们进行了标准化处理,细胞系中的YAP蛋白水平仍然发生了显著下降,这在一定程度上可以解释磷酸化水平的变化(图5H)。我们还发现MDA-MB-468细胞系中Hippo信号通路的几个核心成分(包括STK3,STK38和SAV1)蛋白丰度明显失调(图5H)。通过对YAP的正调控靶标的检测,我们评估了YAP因子的活性变化,发现YAP活性在T47D细胞显著下降(p <0.01),在MDA-MB-468细胞则仅有轻微下降(图5I)。总而言之,这些分析表明ARHGEF17、EAF1、PFKM和PLA2G16等基因拷贝数的变化可以与YAP信号变化联系起来。在肿瘤样品中,ARHGEF17的表达增加与YAP活性增加、对YAP基因丢失的敏感性增加有关,且有趣的是,与对甲氨蝶呤(methotrexate)的敏感性降低也有关(图5J)。这个例子进一步说明了,利用这项研究中确定的调节因子的拷贝数或表达变化,可以获得肿瘤细胞的遗传易感性。
A,YAP pS127潜在调节因子的示意图。红色和蓝色箭头分别表示正相关和负相关。B,多元线性回归模型中单个调节因子对YAP pS127磷酸化水平的作用。C,YAP蛋白和YAP pS127水平的蛋白质印迹分析。D,T47D细胞中ARHGEF17敲低后YAP pS127磷酸化水平的定量分析。E,LATS2(阳性对照)、ARHGEF17、EAF1和PFKM1等基因的过表达细胞中YAPpS127磷酸化水平定量分析(蛋白质免疫印迹)。F,T47D和MDA-MB-468细胞中磷酸化水平数据的差异分析,YAP磷酸位点以红色突出显示。G,改编自Plouffe的Hippo信号通路的示意图。其中红色和橙色圆圈表示YAP / TAZ调节的关键或重要组成部分。H,ARHGEF17水平被敲低后,Hippo信号通路组成部分蛋白质丰度的变化。I,根据蛋白质组学数据估算ARHGEF17水平敲低后YAP的活性。J,不同ARHGEF17表达水平下,细胞内YAP活性水平,对YAP基因丢失的敏感性(RNAi / CRISPR)以及对预测药物的敏感性。D和E中显示的误差线是平均值的标准误差(n = 3个独立实验)。
讨论
----------微科盟更多推荐----------
长按左侧二维码 进入生科云 | |
生科云所有分析工具可以免费使用,不收取任何直接或间接费用;您还可以在微信上联系微生态老师,随时获取免费的指导,帮助您解决分析时遇到的问题;专业的生信分析团队,持续添加、更新、优化生信云上的分析工具,集成多种生信分析流程,一键批量生成主流科研图,帮您节省时间,有更多的时间探究生物学意义。 |
----------微科盟精彩文章----------
科研 | Mol Neurodegener:AIF3剪接开关触发神经退行性疾病
科研 | EMBO J . :有关HIV-1感染的宿主细胞胞外囊泡组成和动力学的非偏性蛋白质组学研究
如果需要原文pdf,请扫描以下二维码,加助理获取
微科享期待与您交流更多蛋白组学问题
(联系蛋白组学老师即可申请入群)
请关注下列二维码
了解更多蛋白组学知识